Day1: Why Pandas

2025 iThome 鐵人賽

DAY 2

Software Development

從零開始Pandas-外加一點Matplotlib系列第 2 篇

17th鐵人賽

Hilda

2025-09-15 23:17:18

212 瀏覽

分享至

What is Pandas

Pandas是用來創建和操作結構化資料的Python函式庫。什麼是結構化資料？簡單來說就是excel或資料庫中的表格資料。不管是資料讀取、篩選、統計匯整，甚至是在excel中有點難處理的groupby、pivot、樞紐分析表，在Pandas都可以輕鬆完成。

官方網站，了解更多 > https://pandas.pydata.org/docs/

Why Pandas

~~因為客戶在用。不是。~~
高效運算：基於Numpy支援向量化運算，效能遠超逐列運算。
高度整合：可無縫銜接Python生態圈的資料分析與機器學習流程。
語法直覺：一行就能篩選出特定資料，與SQL思維接近，入門快。
易於重塑資料：無痛實現橫縱向堆疊/merge/join/melt，還有user最愛的轉置。
支援多種格式：CSV, Excel, JSON, SQL。
資源多:幾乎是資料分析領域的基石，爬文、發問、GPT都so ez。

When Pandas

需要大量處理結構化資料的工作
需要將data清理成分析或機器學習可用格式
需要快速檢視資料分布、找到異常值
商業報表/財務分析
工作高度仰賴excel，但excel又不是很強的平凡小社畜

Installation

有vscode的話安裝也是so ez，在vscode terminal pip install

pip install pandas

了解更多 > https://pypi.org/project/pandas/

How to Start

安裝完記得先import才能使用。先來簡單粗暴的讀個csv檔，後面再詳細介紹。

import pandas as pd
csv_data = pd.read_csv('upload0.csv')
print(csv_data)

import pandas as pd 的意思是匯入pandas這個套件，並以pd為別名，所以後面我們呼叫相關的功能時，都會用pd，而不用打全名pandas，譬如範例中的pd.read_csv。pd是Pandas社群慣用的別名，也可以用其他的別名，但是強烈建議就跟著社群大大們走。

登愣！是不是很簡單，無痛讀csv！

下集預告

Data Structure
Pandas 提供了兩種類型的資料結構來處理資料

Series : 一維資料
Data Frame : 二維資料

Day0: 緣起及大綱

Day2: 初探Data Structure

系列文

從零開始Pandas-外加一點Matplotlib 共 13 篇

RSS系列文訂閱系列文

0 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

從零開始Pandas-外加一點Matplotlib系列 第 2 篇